企业如何构建指标平台并实现智能分析?
导读 指标体系已成为现代企业管理的普遍实践,并成为企业践行数字化经营的利器。指标平台可以帮助企业提高指标管理、加工和应用的效率,提供更智能、高效的分析决策支持。
为了帮助企业更好地开展指标平台实践,实现业务价值,Datafun 邀请到指标平台代表厂商数势科技大数据产品负责人杜永青带来分享。本文将介绍数势指标平台的产品建设方案以及企业落地实践案例。主要包含以下三块内容:1. 数据民主化&价值化的趋势与挑战
2. 指标平台产品和技术方案介绍
3. 指标平台在企业的落地实践案例
分享嘉宾|杜永青 数势科技 大数据产品负责人
编辑整理|张翎
内容校对|李瑶
出品社区|DataFun
指标平台产品和技术方案介绍
1. 数势指标平台产品定位及应用场景
目标的设置,支持手动 & 批量上传的方式,设置全局目标和按月季年时间粒度、业务部门等维度拆解目标。 指标口径的共识和追踪,支持目标绑定具体的指标,在指标平台上进行指标口径的标准化管理、发布以及数据的监控追踪。 任务设置和下发,支持管理人员为改善过程指标,直接派发相关的工作任务给具体的执行人员。每个过程指标改善相关的工作任务可以由业务专家提前设置,同时在业务日常运营中不断积累沉淀。
将指标平台融合大模型能力做智能分析的好处:
支持更灵活、更精准的意图识别以及后续指标取数、分析等应用。大模型本身的一个“缺陷”就是不够精准,要精准就得付出更多基础的、标准化数据的建设,基于指标管理方法产出的指标相关知识很好得解决了这个问题,主要包括由原子粒度信息(原子指标、维度、统计周期)构成的指标语义层、指标树关系、指标元数据信息、血缘关系等。
指标是结构化的业务知识,更利于做面向业务人员的应用,业务也能参与进来丰富和迭代知识模型。
指标平台自带的指标计算引擎解决了查询性能问题,可以支持跟用户的即时交互。大模型赋能的智能分析落地在技术上分两步,第一步识别用户意图并分解为任务,这里很大一部分任务是去从指标平台取数据;第二步是基于取出来的数据做可视化分析、归因分析等。其中第一步指标取数依赖指标计算引擎的查询性能,基于大数据的查询、复杂计算都在这一步完成,比如从大数据量的明细表里取数、算同环比等,第二步的数据量一般是汇总级的少量数据,在指标 Copilot 的计算能力范围内。
数据复用粒度从对数据表的复用升级为对指标的复用,且业务要用到的派生指标、衍生指标都可以通过原子指标积木式组装出来,这样可以极大减少数据表,降低开发运维成本。 后续应用端只需要做指标展示,数据存储、计算、权限管控都集中在指标平台,让专业的大数据团队和工具做这些事情,指标口径更容易管理,应用端的权限一致性、查询性能等都能得到更好的支持。
2. 数势指标平台核心技术
首先,底层选用 Doris 作为执行引擎,因为 Doris 无论在大数据量查询方面,还是跨模型、跨表的关联查询以及物化视图等方面,都具备强大的能力。 其次,数势计算引擎 HME 结合了众多大数据分析专家的经验,可实现指标的精确计算。该引擎主要具备两大核心能力:一是基于视图的预计算能力,计算引擎会收集到所有的指标定义信息和所有的数据模型信息,然后根据预置的多种计算优化策略以及参数设定来做预计算;二是基于预计算结果的查询优化,引擎会根据要查询的指标,以及当前可用的物化表,来做查询 Query 的改写优化,从而提升指标查询的时效性。 此外,平台提供了非常多样化的集成方式,与下游各种数据应用包括BI工具去对接集成。 最后,指标计算引擎整体是基于数据虚拟化理念设计的,可实现指标定义与物理数据(业务)的解耦,从而实现更加灵活的指标加工使用。
第一步是做预打宽。当最底层物理表导入并注册到指标平台的时候,会以数据模型的形式存在,为减少后面现计算的 Join 数量,这里会先把相关表做好关联,比如把事实表跟维表关联好;此外在这个环节,还会做一些其他优化,比如重分区等。 第二步是做预聚合。针对一些特殊的指标,也会提前计算好,比如常用的原子指标,再比如很多计算复杂度比较高的指标,如同环比,年至今累计等等。 第三步是聚合上卷。识别指标一些常用的维度提前做好更粗粒度的聚合,比如把指标相关的十几个维度聚合到三四个常用维度,减少表数据量。 最后是指标联合。针对跨多个模型查询多个指标的场景,会做专门的优化策略,比如最简单的一种优化策略就是把所跨的多个模型提前关联在一起。
降低业务用数门槛,业务可以用统一可信的指标直接取数做报表,不用技术排期等待; 提升业务智能分析能力,通过对话式交互即可完成业务指标拆解、数据异常预警和快速定位原因; 提高开发运维效率,数据复用粒度从数据表升级为指标,极大减少了数据集市表数量,提高了数据复用性; 实时指标查询分析,根据指标加工和应用场景打造的指标智能计算引擎,保证指标查询性能。
指标平台在企业的落地实践案例
分享嘉宾
INTRODUCTION
杜永青
数势科技
大数据产品负责人
数势科技的大数据产品负责人,在大数据架构、指标体系设计、指标平台产品建设和运营等方面有非常丰富的经验,在数势之前在京东有接近10年的大数据技术和产品从业经验。
往期推荐
点个在看你最好看